随着作者的数量在多年来呈指数增长,共享相同名称的作者数量正在按比例增加。这使得将新发表的论文分配给其足够的作者是一项挑战。因此,作者名称歧义(ANA)被认为是数字库中的关键开放问题。本文提出了一个作者名称歧义(和)方法,该方法通过利用其合着者和研究领域来将作者姓名与其现实世界实体联系起来。为此,我们使用了DBLP存储库中的收藏集,其中包含大约260万名合着者撰写的超过500万本书目记录。我们的第一组作者共享相同的姓氏和相同的名字名称。通过捕获与他/她的合着者和研究领域的关系来确定每个小组内的作者,这是由相应作者的经过验证的出版物的标题代表的。为此,我们训练一个神经网络模型,该模型从共同作者和标题的表示中学习。我们通过在大型数据集上进行大量实验来验证方法的有效性。
translated by 谷歌翻译
在本文中,我们展示了一种独特的配方,可以通过将预处理技术融合到深度学习模型中来增强音频机学习方法的有效性。我们的解决方案通过通过训练而不是昂贵的随机搜索来优化超参数来加速培训和推理性能,从而从音频信号中构建可靠的蚊子探测器。此处介绍的实验和结果是MOS C提交ACM 2022挑战的一部分。在未发表的测试集上,我们的结果优于已发布的基线212%。我们认为,这是建立强大的生物声学系统的最好的现实世界中的一个例子之一,该系统在嘈杂的条件下提供可靠的蚊子检测。
translated by 谷歌翻译
对于自动语音识别(ASR)系统而言,检测和恢复量不足(OOV)单词总是具有挑战性的。许多现有的方法着重于通过修改声学和语言模型并巧妙地集成到模型的上下文单词来对OOV单词进行建模。为了培训这样的复杂模型,我们需要大量数据,其中包括上下文单词,额外的训练时间和增加模型大小。但是,在获取ASR转录以恢复基于上下文的OOV单词之后,对后处理方法的探索并未得到太多探索。在这项工作中,我们提出了一种后处理技术,以提高基于上下文的OOV恢复的性能。我们创建了一个具有声音增强的语言模型,并在电话级上用OOV单词列表制作了子图。我们提出了两种方法来确定合适的成本函数,以根据上下文检索OOV单词。成本函数是根据语音和声学知识来定义的,用于匹配和恢复解码中的正确上下文单词。在文字级别和句子级别上都评估了提议的成本函数的有效性。评估结果表明,这种方法可以平均在多个类别中恢复50%基于上下文的OOV单词。
translated by 谷歌翻译
我们提出了一种共同校正的随机批处理方法,用于相互作用的粒子系统。通过建立特定的熵中心限制定理,我们为所提出方法的所有粒子的整个轨迹的定律提供熵收敛的保证\ alpha n)^{\ frac {1} {3}} $(其中$ n $是粒子的数量,$ \ alpha $是时间离散参数)。反过来,这意味着当$ b $甚至中等大的时候,这些方法的输出几乎是\ emph {统计上无法区分的}。先前的作品主要考虑在瓦斯恒星距离中的收敛性,对电势或边界的必要严格假设具有指数依赖性对时间范围的依赖性。这项工作使对相互作用势的假设最少,尤其是确定即使粒子轨迹差异到无穷大,它们也以两种方法的方式这样做。鉴于基于粒子的相互作用算法的最新进展,这种保证非常有用。
translated by 谷歌翻译
经验重播方法是加固学习(RL)算法的重要组成部分,旨在减轻伪造的相关性和偏见,同时从时间依赖的数据中学习。粗略地说,这些方法使我们能够从大型缓冲液中绘制批处理的数据,从而使这些时间相关性不会妨碍下降算法的性能。在这项实验工作中,我们考虑了最近开发和理论上严格的反向经验重播(RER),该重播已被证明可以消除简化的理论环境中的这种虚假偏见。我们将RER与乐观的经验重播(OER)相结合,以获得RER ++,在神经功能近似下这是稳定的。我们通过实验表明,在各种任务上的优先体验重播(PER)等技术的性能要比计算复杂性明显较小,具有更好的性能。在RL文献中众所周知,选择最大的TD误差(如OER)或形成具有连续数据点(如RER)的迷你批次而贪婪地选择示例。但是,结合这些技术的方法效果很好。
translated by 谷歌翻译
因果关系的科学通过为此目的提供数学工具来解释/确定系统实体之间的关系关系。尽管机器学习(ML)算法的所有成功和广泛应用,但这些算法仅基于统计学习。目前,他们无处可靠近“人类的”智力,因为他们未能以重要的“为什么?”问题。因此,研究人员正在试图将ML与因果关系的科学集成。在ML遇到的许多因果学习问题中,其中一个是这些算法对数据的时间顺序或结构愚蠢。在这项工作中,我们基于最近提出的“Neurochaos”特征学习技术(Chaosfex特征提取器)开发机器学习管道,这有助于我们在给定的时间序列数据中学习广义因果结构。
translated by 谷歌翻译
人工智能(AI)为简化Covid-19诊断提供了有前景的替代。然而,涉及周围的安全和可信度的担忧阻碍了大规模代表性的医学数据,对临床实践中训练广泛的模型造成了相当大的挑战。为了解决这个问题,我们启动了统一的CT-Covid AI诊断计划(UCADI),其中AI模型可以在没有数据共享的联合学习框架(FL)下在每个主机机构下分发和独立地在没有数据共享的情况下在每个主机机构上执行。在这里,我们认为我们的FL模型通过大的产量(中国测试敏感性/特异性:0.973 / 0.951,英国:0.730 / 0.942),与专业放射科医师的面板实现可比性表现。我们进一步评估了持有的模型(从另外两家医院收集,留出FL)和异构(用造影材料获取)数据,提供了模型所做的决策的视觉解释,并分析了模型之间的权衡联邦培训过程中的性能和沟通成本。我们的研究基于来自位于中国和英国的23家医院的3,336名患者的9,573次胸部计算断层扫描扫描(CTS)。统称,我们的工作提出了利用联邦学习的潜在保留了数字健康的前景。
translated by 谷歌翻译
由于对社会,经济学和环境的巨大影响,智能电网(SG)的研究和发展引起了学术界,行业和政府的重视。确保SG是一个很大的重大挑战,因为增加了通信网络以协助物理过程控制,将它们暴露于各种网络威胁。除了使用假数据喷射(FDI)技术改变测量值的攻击之外,通信网络上的攻击可能通过拦截消息来破坏电力系统的实时操作,或者通过泛洪与不必要的数据泛换通信信道。解决这些攻击需要跨层方法。在本文中,呈现了一种交叉层策略,称为具有自适应统计(CECD-AS)的交叉层集合RORDET,其集成了故障的SG测量数据的检测以及不一致的网络到达时间和传输延迟,以便更可靠地进行传输延迟准确的异常检测和攻击解释。数值结果表明,与当前方法相比,CECD-AS可以检测多个错误数据喷射,拒绝服务(MITM)攻击中的拒绝服务(MITM)攻击的攻击(MITM)攻击。基于传统的基于物理的状态估计,具有自适应统计策略和基于机器学习分类的检测方案的集合RORDET。
translated by 谷歌翻译
本文识别数据分布的结构属性,使得深神经网络能够分层学习。我们定义了在布尔超立方体上的功能的“楼梯”属性,该功能在沿着增加链的低阶傅里叶系数可达高阶傅里叶系数。我们证明了满足该属性的功能可以在多项式时间中使用常规神经网络上的分层随机坐标血液中学到多项式时间 - 一类网络架构和具有同质性属性的初始化。我们的分析表明,对于这种阶梯功能和神经网络,基于梯度的算法通过贪婪地组合沿网络深度的较低级别特征来了解高级功能。我们进一步回复了我们的理论结果,实验显示楼梯功能也是由具有随机梯度下降的更多标准Reset架构进行学习的。理论和实验结果都支持阶梯属性在理解基于梯度的学习的能力的情况下,与可以模仿最近所示的任何SQ或PAC算法的一般多项式网络相反,阶梯属性在理解普通网络上的能力相反。
translated by 谷歌翻译
我们考虑载有X_ {t + 1} = \ phi(a ^ * x_t)+ \ eta_t $的设置,其中$ \ eta_t $是无偏见的噪音和$ \ phi:\ mathbb {r \ to \ mathbb {r} $是已知的链接功能,满足某些{\ em扩展性属性}。目标是从单个轨迹$ x_1,\ cdots,x_t $的{\ em依赖或相关}样本中学习$ a ^ * $。虽然在线性案例中,在线性案例中的问题很好,而$ \ phi $是身份,但对于非混音系统,最佳错误率,即使是非混音系统,也存在于非线性案例的结果仅适用于混合系统。在这项工作中,我们以多种方式改善了用于学习非线性系统的现有结果:a)我们提供了在没有混合假设的情况下学习非线性动态系统的第一个离线算法,B)我们显着提高了现有的样本复杂性结果混合系统,c)在更难的单遍,流媒体设置中,我们研究了一个具有反向体验的SGD($ \ MATHSF {SGD-RER} $)方法,并证明用于混合系统,它实现了相同的样本复杂性作为我们的离线算法,d)我们通过表示流行的Relu链接功能来证明扩张假设 - 一种与IID的非膨胀而易于学习的链接函数样本 - 任何方法都需要指数呈现许多样本(相对于X_T $的维度)来自动态系统。我们通过验证我们的结果。仿真并证明SGD的天真应用可以高度次优。实际上,我们的工作表明,对于相关的数据,专门用于数据中的依赖结构的专用方法可以显着优于基于标准的SGD方法。
translated by 谷歌翻译